演讲

GTC 2021 春 — AI Factory 概念与三芯片战略

开场：四股力量塑造着世界

GTC 2021 春是 NVIDIA 第一次系统性地把"AI 工厂"的雏形放到台面上讲。黄仁勋开场就抛出了他那年反复强调的四股力量：

"加速计算是我们开创的技术方向，它让科学发现加速、为计算机产业指出一条向前的路。人工智能——尤其是它——取得了令人难以置信的进展：有了 NVIDIA GPU，计算机能学习，软件能写出人类写不出的软件。AI 软件以云服务的形式交付，以光速执行自动化。软件如今由微服务组成，在整个数据中心里扩展——数据中心本身成为一个计算单元。AI 和 5G 是开启第四次工业革命的原料——自动化和机器人学能够被部署到世界的边缘。而我们还需要一个奇迹——元宇宙，一个是我们世界的数字孪生。"

他还画了一张 NVIDIA 这次演讲的四层架构：Omniverse（创建并仿真虚拟世界的平台）→ DGX 与数据中心（新 CPU、新 DPU、AI 药物发现、量子计算）→ EGX + Aerial 5G（把 AI 带到企业和边缘）→ Drive（汽车行业的革命）。这是他第一次用"stack"的比喻把 NVIDIA 的版图铺在一张图上。

一张能改变人一生的工具

开场他讲了一段他后来反复引用的故事："一位科学家对我说过——因为你们的工作，我能在有生之年完成我一生的事业。我想不出比这更高的使命了。" 这句话奠定了整场演讲的情感基调。他接着说："我们的目的是为这个时代的达·芬奇们打造工具——为了做到这件事，我们也在共同创造未来。"

然后是一组让人印象深刻的生态数字：累计出货超过 10 亿颗 CUDA 平台 GPU、云上 250 exaflops 的 GPU 算力、250 万名开发者、7500 家初创公司。他引用了 2012 年那个神话时刻：AlexNet 就是 Alex Krizhevsky、Ilya、Geoffrey Hinton 用 GeForce 训练出来的——"只要有一张 GeForce，每一个学生都能拥有一台超级计算机。"（GeForce、Ilya Sutskever、Geoffrey Hinton）

Omniverse：为虚拟世界打造的物理平台

"RTX 重置了计算机图形学。这让我们可以建 NVIDIA Omniverse——一个连接 3D 世界的共享虚拟世界平台。这并非没有科幻背景——Neal Stephenson 1990 年代初的小说《Snow Crash》里描述了一个叫 Metaverse 的世界，一种由共享 3D 空间和虚拟增强的物理空间组成的互联网的延伸。"

Omniverse 的几个核心组件都在这次被讲明白：
- Omniverse Nucleus：一个数据库引擎，连接用户、交换 3D 资产和场景描述。采用 Pixar 发明的开放标准 USD（Universal Scene Description）。多个用户可以同时连接 Nucleus，以 USD 片段的形式收发对虚拟世界的改动。
- 合成、渲染、动画引擎：完全物理级别的——全路径追踪，用 NVIDIA PhysX 做物理模拟，用 NVIDIA MDL 做材质，并且和 NVIDIA AI 深度集成。
- CloudXR：黄仁勋叫它"传送门"（Stargate）——你可以通过 VR 把自己"传送"进 Omniverse，AI 也可以通过 AR 从 Omniverse 里"传送"出来。

但真正的杀手级案例是 BMW。他和 BMW 董事会成员 Milan Nedeljkovic 博士做了一场虚拟厂房参观：

"BMW 是世界上最大的定制制造公司之一。他们在最先进的工厂里，每一分钟造一辆车，而每辆都是定制的——每年超过 250 万辆车，99% 是定制化的。我们和 BMW 一起造一座未来工厂，从头到尾完全在数字世界里设计、仿真、运营。工厂将变成一个机器人——编排内部的机器人、建造也是机器人的汽车。虚拟工厂和物理工厂会形成一个闭环——它们是数字孪生。"

BMW 计划用 Omniverse 仿真全球 31 座工厂，规划效率提升 30%。这是"工厂的数字孪生"第一次在 NVIDIA 的舞台上有这么具体的对象。

Omniverse 的哲学被浓缩成一句话："Omniverse 是一个基于物理的虚拟世界，机器人可以在这里学会成为机器人。"（Isaac）这条技术路径后来一路延伸到 Isaac Gym、Cosmos、GR00T。

数据中心是新的计算单元

"数据中心是新的计算单元。" 这是这场演讲里最重要的一句概念声明之一。

他从数据中心的架构演化讲起：企业数据中心原来跑的是单体软件；虚拟化把它变成软件定义数据中心；云原生把它拆成可跨闲置资源调度的微服务；然后深度学习来了，CSP 靠 Mellanox 的高速低延迟网络对抗东西流量的爆炸。然后"零信任安全"又让基础设施软件处理本身成为数据中心里最大的工作负载之一。

"所以我们需要一种新的芯片，一种专为数据中心基础设施处理而设计的芯片——NVIDIA BlueField DPU。"

BlueField 的原理很直白：CPU 本来就只有那么多核心，每一核都在跑"软件定义数据中心"的栈时，真正能跑应用的核心就越来越少。"每年出货的大约 3000 万台数据中心服务器里，大约 1/3 被这些基础设施软件栈吃掉了——这个工作负载的增长比摩尔定律快得多。如果不卸载并加速它，数据中心能跑应用的 CPU 就会越来越少。BlueField 的时代来了。"

他同时发布了 BlueField-3（220 亿晶体管，第一款 400 Gbps 网络芯片，16 个 ARM 核，内置 VMware ESX 的完整虚拟化栈）并预告 BlueField-4（800 Gbps，加入 AI 计算）——"每 18 个月一代，3 年内 100 倍提升。"

DGX 系列：AI 的计算机

"在现代 AI 大爆发的起点，我们意识到要做出一种全新的计算机——因为一种全新的软件开发方式出现了。软件将由软件来写，运行在 AI 计算机上。" 这段话是他 AI 工厂叙事的最早成型。

"如果软件要由计算机来写，那么拥有最好软件工程师的公司，也必须拥有最好的计算机。" 他由此铺开了 DGX 系列：
- DGX A100：5 petaflops 计算单元，是所有更大系统的基础积木。
- DGX Station 320G：一台"装在盒子里的 AI 数据中心"——可以直接插在普通插座上、4 颗 A100、320 GB HBM2e、8 TB/s 内存带宽。"要用 40 台 CPU 服务器才能达到这个内存带宽。" 液冷到静音 37 分贝。售价 149000 美元——而一台同等性能的 CPU 集群要 100 万美元。
- DGX SuperPOD：一个完全集成、网络优化的 AI 数据中心，作为"产品"交付。起步 700 万美元，最大规模 6000 万美元。NVIDIA 自己的 Selene 就是四座 SuperPOD 组成的，是当时全球第五快的超级计算机、工业领域第一。

他也第一次讲了后来会无数次出现的一个算术："模型规模每 2.5 个月就翻一倍。明年我们会看到万亿参数模型，2023 年会看到 100 万亿参数模型。作为非常粗略的对比——人脑有大约 125 万亿个突触。" 他借此发布了 Megatron——专门训练超大 Transformer 的框架。

Project Grace：NVIDIA 的第一颗数据中心 CPU

这是当天最重磅的硬件发布。Grace CPU 是 NVIDIA 第一颗面向数据中心的 CPU——以计算机先驱、美国海军少将 Grace Hopper 命名。

黄仁勋先解释为什么需要它。他拿 DGX 的一半做示例：每颗 GPU 连 80 GB 的 HBM，带宽 2 TB/s；四颗 GPU 加在一起是 320 GB、8 TB/s。对比 CPU 内存——1 TB 大，但只有 0.2 TB/s。"CPU 内存比 GPU 内存大 3 倍，但慢 40 倍。我们希望能把整个节点的 1320 GB 内存都用来训练 AI 模型。"

解决方案呢？"造更快的 CPU 内存、四通道直连 CPU，每个通道喂一颗 GPU。但问题来了——PCIe 变成新的瓶颈。我们当然可以用 NVLink——它够快——但没有一颗 x86 CPU 有 NVLink，更不用说四条。"

"所以今天，我们发布我们的第一颗数据中心 CPU——Project Grace。" 它基于 ARM 架构、为大数据加速计算场景（特别是 AI）而专门设计。每颗 CPU 可以做 300 SPECint；一台八 GPU DGX 搭载 Grace 后，总体 CPU 性能是 2400 SPECint——而今天最快的 DGX 只有 450 SPECint。"让我们对比一下——之前是 450，之后是 2400。这是系统级带宽和内存带宽的巨大提升。"

瑞士国家超算中心宣布会基于 Grace + 下一代 GPU 建一台叫 ALPS 的超算——20 exaflops 的 AI 算力，比当时最快的超算快 10 倍，2023 年上线。

这颗 CPU 的意义远超过它本身。黄仁勋宣布："NVIDIA 的数据中心路线图现在由三颗芯片构成：CPU、GPU、DPU。每种架构两年一代，中间可能还有 tick。一年聚焦 x86 平台，一年聚焦 ARM 平台，每年都会有新品。三颗芯片，年年迭代，一套架构。"

这是 NVIDIA 首次正式宣布自己是一家"三芯片公司"。这条路线图后来一路延伸到 Grace Hopper（GH200）、Grace Blackwell（GB200）、Vera Rubin。

EGX + Aerial 5G：把 AI 带到边缘

"AI 有四波浪潮。第一波是重新发明计算，用新方式写软件——我们已经深耕近十年。第一波的采用者是互联网公司，他们有优秀的计算机科学家、大型计算基础设施、收集训练数据的能力。现在我们正处于下一波的起点——企业与工业边缘，AI 将革命性地改变制造、物流、农业、医疗、金融、交通这些世界上最大的产业。最后一波是自动系统——自动驾驶是一个绝佳例子，但未来所有会动的东西都会变成自动的。"

NVIDIA 的解法是 NVIDIA EGX + VMware。黄仁勋强调："全球 70% 的企业都在用 VMware，NVIDIA 自己也是。" 过去 VMware 是把多个应用跑在一台虚拟机上；而 AI 恰恰相反——它要在多 GPU、多节点上跑 bare metal 的单一任务。"我们把 NVIDIA 所有的计算和数据传输优化都打通到 VMware 栈里，同时通过 BlueField 卸载加速——这样 VMware 的 30 万企业客户终于可以轻松构建 AI 基础设施。"

然后是 Aerial A100——一张把 Ampere GPU 和 BlueField DPU 合在一块的 PCIe 卡，同时是一座完整的 5G 基站。"把 5G 的全部能力带进云，也把云的全部能力带进 5G 边缘。"这是他在 GTC 2025 与 T-Mobile 合作、做 AI-RAN 的前身。

Jarvis、Merlin、Maxine、Morpheus：预训练模型即产品

NVIDIA 在 GTC 2021 春开始把 AI 模型变成"开箱即用"的产品——黄仁勋称之为 NVIDIA AI 平台：
- Jarvis：对话式 AI，开箱 90% 识别准确率，支持 5 种语言，端到端 100 毫秒级延迟。"听懂、理解、回应的速度比眨眼还快。"
- Merlin：开源推荐系统框架，ETL 快 10-50 倍、训练快 2-10 倍、推理快 3-100 倍。
- Maxine：视频会议 AI（眼神接触修正、面部编解码在 50 kbps 带宽下也能工作）——以后会成为你在 Omniverse 里的 avatar。
- Morpheus：数据中心安全平台，用 AI 做实时全包检查，让每一个服务器到服务器的通信都可以被监控。
- TAO：让你用自己的数据微调 NVIDIA 预训练模型，配合联邦学习。
- Triton Inference Server：跨所有主流框架、跨 GPU/CPU 的推理调度引擎。
- Fleet Command：云原生的边缘 AI 编排平台。

这些组件后来逐步演化、整合进 NIM 和 AI Foundry。可以说 GTC 2021 春是 NVIDIA 企业 AI 产品线的起点。

Drive 与 Atlan：把车变成可编程的计算机

这一段他强调了一个理念——"TOPS 是新的马力。开发者越懂 AV，算法就越先进，计算需求就越高。"

两个发布：
1. Drive Orin——2022 年量产，不仅是 AV 计算机，同时是汽车的中央计算机，在一颗芯片上处理仪表盘、信息娱乐、座舱交互 AI，以及最关键的"置信视图"（confidence view）——车当前对周围 3D 世界的感知。"未来，后视镜会被 3D 环视感知取代。"
2. Drive Atlan——下一代，单芯片 1000 TOPS，超过今天大多数 L5 robotaxi 的总算力。

他在这里甩出了一个未来判断："未来的汽车会是完全可编程的计算机。汽车公司的商业模式会变成软件驱动的——为一辆车的整个生命周期提供软件服务。这种新的科技视角把汽车不再看作一件卖出去的产品，而是一个数千万、数亿台规模的装机基础——在上面可以造出数十亿美元的服务机会。"

"世界每年移动 10 万亿英里。哪怕只有一小部分由 robotaxi 完成，这个机会也是巨大的。美国到 2023 年会缺 10 万名卡车司机，欧盟已经缺 15 万人，中国缺 400 万司机。"

谢幕：20 年前是科幻，10 年前是梦想

"多么精彩的一届 GTC。我讲了几件事——NVIDIA 是一个全栈计算平台。我们在用 Omniverse 构建虚拟世界——这是一个会帮助我们构建下一波机器人和自动驾驶 AI 的奇迹平台。我们发布了新的 DGX 系统和新软件——训练超大 Transformer 的 Megatron、做药物发现的 Clara、做量子计算的 cuQuantum。NVIDIA 现在是一家三芯片公司——加上 Grace CPU，加上 BlueField-3 DPU。"

"我们宣布了 NVIDIA EGX + Aerial 5G，让所有公司和行业都能用上 AI。我们发布了 Drive——面向 10 万亿美元运输行业的端到端平台。从 Orin、Atlan、Hyperion 8 到 DriveSim……"

"20 年前，这一切都还是科幻小说；10 年前是梦想；今天，我们正活在其中。"

"感谢所有的开发者和合作伙伴，特别感谢 NVIDIA 的全体员工。我们的目的是把我们的手艺磨炼得更好，这样你们这个时代的达·芬奇们才能把你们的手艺磨炼得更好。归根结底，NVIDIA 是一件工具——一件让你能完成一生事业的工具。"

原文出处：Rev.com 完整转录稿

链接到本页 10

…功能机房，而是一座 24/7 不停生产 token 的工厂——原料是数据，产出是智能**。这个概念的雏形最早出现在 2021-04 GTC 2021 春 - AI Factory 概念——他在那场演讲里第一次说"数据中心是新的计算单元"，并把 DGX 描述成"装在盒子里的 AI 数据中心"。但"…

查看原文 →

…- 2012-2016 年：AlexNet 之后，加速计算从科学计算长到深度学习。 - 2021 年：2021-04 GTC 2021 春 - AI Factory 概念第一次把加速计算和"数据中心是新计算单元"放在一起讲。 - 2023 年：iPhone 时刻——加速计算从"N…

查看原文 →

…actories]] ### 核心要义第一,数字孪生不是 3D 模型，是物理仿真。黄仁勋在 2021-04 GTC 2021 春 - AI Factory 概念强调 NVIDIA Omniverse 用全路径追踪、PhysX 物理引擎、MDL 材质、深度集成 NVIDI…

查看原文 →

…，而是 NVLink72 + InfiniBand 把几十万张 GPU 连成的一个分布式系统。最早的明确表述出现在 2021-04 GTC 2021 春 - AI Factory 概念： > "The data center is the new unit of computing." > >…

查看原文 →

…（数据处理单元） - 类型：自建业务（源自 2019 年收购 Mellanox） - 首次提及：2021-04 GTC 2021 春 - AI Factory 概念 - 提及次数：6 次（GTC 2021 春/秋、GTC 2022 春、FY24 财报均有提及） ## 定义…

查看原文 →

…类型：自建业务（AI 整机系统） - 创立时间：2016 年（DGX-1 发布） - 首次提及：2021-04 GTC 2021 春 - AI Factory 概念 - 提及次数：18 篇素材中 15 篇明确出现 ## 一句话定位 DGX 是 NVIDIA 把"A…

查看原文 →

…全称：NVIDIA Drive — 端到端自动驾驶与智能汽车平台 - 类型：自建业务 - 首次提及：2021-04 GTC 2021 春 - AI Factory 概念（本知识库覆盖范围内；Drive 平台实际可追溯至 2015 年 CES） - 提及次数**：10+ 次（GTC 2…

查看原文 →

…rise、OVX 系统等） - 类型：自建业务（工业元宇宙 / 数字孪生平台） - 首次提及：2021-04 GTC 2021 春 - AI Factory 概念 - 提及次数：18 篇素材中 11 篇明确出现 ## 一句话定位 NVIDIA Omniverse 是 N…

查看原文 →

…72 / NVL144 / NVL576） - 类型：自建业务（互联协议 + 交换芯片） - 首次提及：2021-04 GTC 2021 春 - AI Factory 概念 - 提及次数：18 篇素材中 12 篇明确出现 ## 一句话定位 NVLink 是 NVIDIA 把"很多…

查看原文 →

…超级计算机 Project DIGITS / Cosmos 物理基础模型 / RTX 50 系列 - 2021-04 GTC 2021 春 - AI Factory 概念 —— "AI 工厂" 概念第一次清晰提出 / Bluefield / Morpheus ### 摘要 / 节…

查看原文 →